Tm ma Fusik c Mˆjhma: Pijanìthtec -Sfˆlmata-Statistik PerÐodoc: Febrouˆrioc 2008

Tm ma Fusik c Mˆjhma: Pijanìthtec -Sfˆlmata-Statistik PerÐodoc: Febrouˆrioc 2008 Jèma 1. a 'Enac upologist c dèqetai kajhmerinˆ e-mail. Apì prohgoômena dedomèna gnwrðzoume ìti ta 7/10 twn e-mailc pou stèlnontai sto diadðktuo eðnai spam, en ta 3/10 eðnai kanonikˆ. EpÐshc, èqoume parathr sei ìti to 20% twn spam perièqoun th lèxh epeðgon en h Ðdia lèxh perièqetai sto 10% twn kanonik n. An èrjei m numa pou perièqei th lèxh epeðgon poiˆ eðnai h pijanìthta na eðnai kanonikì? Na perigrafeð to je rhma pou ja qrhsimopoi sete. b (Sunèqeia 'Estw ìti èna prìgramma sb nei èna m numa spam me pijanìthta 1/2. An èrjoun 100 spam, poia eðnai katˆ prosèggish h pijanìthta na sb sei toulˆqiston 50? Poia eðnai katˆ prosèggish h pijanìthta na sb sei perissìtera apì 50 kai ligìtera apì 75? Na perigrafeð to je rhma to opoðo ja qrhsimopoi sete. Jèma 2. a Mia tuqaða metablht èqei ajroistik sunˆrthsh katanom c F (x = 0, an x < 0, F (x = 1 2 x, an 0 x 2 kai F (x = 1 an x > 2. Na upologisjoôn ta ex c: P ( 1 2 X 3 2, P (X 1 2 X 3 2, h mèsh tim E(X, kaj c kai h diasporˆ V (X. b 'Estw ìti h tuqaða metablht Q, pou perigrˆfei ènan periballontikì rôpo, akoloujeð thn Kanonik katanom me mèsh tim 85 kai tupik apìklish 20. PaÐrnoume 10 anexˆrthtec metr seic. Poia eðnai h pijanìthta toulˆqiston 2 metr seic na eðnai megalôterec twn 65? Na dikaiologhjeð h qr sh thc ìpoiac katanom c qrhsimopoi sete. Jèma 3. a DÐnontai dôo deðgmata twn opoðwn eðnai gnwstˆ: A. Ta megèjh touc N 1 = 30 kai N 2 = 20 B. Oi tupikèc apoklðseic touc s 1 = 73.88 kai s 2 = 56.06 kai G. Oi mèsec timèc touc x 1 = 242 kai x 2 = 276.5 ZhteÐtai na dikaiologhjeð sth stˆjmh shmantikìthtac 0.05 h epilog tou elègqou twn mèswn tim n pou ja qrhsimopoi sete kai sth sunèqeia na brejeð sth stˆjmh shmantikìthtac 0.10 an isqôei statistikˆ x 2 > x 1. b Sthn katanom suqnot twn tou parakˆtw anexˆrthtou deðgmatoc, megèjouc N = 60, prosarmìsjhke ènac jewrhtikìc nìmoc me gnwstèc tic paramètrouc tou.

Antiproswpeutikèc Sqetikèc Jewrhtikèc timèc empeirikèc pijanìthtec suqnìthtec A 1 0.214 0.334 A 2 0.571 0.335 A 3 0.143 0.202 A 4 0.048 0.074 A 5 0.024 0.02 ZhteÐtai na apant sete sta ex c: 1.MporeÐ na efarmosjeð o χ 2 èlegqoc kal c prosarmog c? (dikaiolog ste 2.Efarmìsate ton χ 2 èlegqo sth stˆjmh shmantikìthtac 0.05 kai deðxte an upˆrqei ìqi kal prosarmog tou jewrhtikoô nìmou sto deðgma. 3. Ja kˆnate sunènwsh tˆxewn diasthmˆtwn kai giatð? An kˆnate ja ephrèaze to apotèlesmˆ sac? ShmeÐwsh: Na grafoôn kai ta 3 jèmata. Oi apant seic na eðnai aitiologhmènec. Kal epituqða!

ÔìÞìá ÖõóéêÞò Ðéèáíüôçôåò-ÓöÜëìáôá-ÓôáôéóôéêÞ ÖåâñïõÜñéïò 2008 ÁðáíôÞóåéò èåìüôùí ÈÝìá 1. á óôù ôá åíäå üìåíá B : Á 1 : A 2 : ìþíõìá ðåñéý åé ôç ëýîç \åðåßãïí" ìþíõìá êáíïíéêü ìþíõìá spam Æçôåßôáé ç ðéèáíüôçôá IP(A 1 B Ôá åíäå üìåíá A 1 ; A 2 áðïôåëïýí äéáìýñéóç ôïõ äåéãìáôéêïý þñïõ (óýíïëï ìçíõìüôùí. Åöáñìüæïõìå ôï Èåþñçìá Bayes IP(A 1 B = Áðü ôçí åêöþíçóç ôçò Üóêçóçò Ý ïõìå IP(A 1 IP(B A 1 IP(A 1 IP(B A 1 + IP(A 2 IP(B A 2 IP(A 1 = 0:3; IP(A 2 = 0:7 IP(B A 1 = 0:1; IP(B A 2 = 0:2 Áíôéêáèéóôïýìå êáé ðñïêýðôåé üôé IP(A 1 B = 3 17 : â (ÓõíÝ åéá Åóôù ïé ôõ áßåò ìåôáâëçôýò X i = { 1; ôï ðñüãñáììá óâþíåé ôï i-ïóôü spam 0; ôï ðñüãñáììá äå óâþíåé ôï i-ïóôü spam i = 1; : : : ; 100: Ïé ô.ì. áõôýò åßíáé áíåîüñôçôåò êáé éóüíïìåò ô.ì Bernoulli ìå ðéèáíüôçôá åðéôõ ßáò p = 1=2: Åóôù S 100 = X 1 + : : : + X 100 ï áñéèìüò ôùí åðéôõ éþí óôéò 100 äïêéìýò. (áñéèìüò spam ðïõ èá óâçóôïýí óôá 100 ìçíýìáôá spam ðïõ Ýñ ïíôáé Æçôåßôáé íá âñåèïýí êáôü ðñïóýããéóç ïé ðéèáíüôçôåò IP(S 100 50 êáé IP(50 < S 100 < 75: (Ç ìåôáâëçôþ S 100 áêïëïõèåß ôç ÄéùíõìéêÞ êáôáíïìþ ìå ðáñáìýôñïõò = 100 êáé p = 1=2: Åßíáé IE(S 100 = p = 100 1 = 50 2 êáé Var (S 100 = = 100 1 1 = 25: 2 2 Åöáñìüæïõìå ôï Êåíôñéêü Ïñéáêü Èåþñçìá ôùí De Moivre-Laplace. Äßíïõìå ðñïóýããéóç áðü ôçí ÊáíïíéêÞ êáôáíïìþ. 1

Åßíáé S IP(S 100 p 100 50 = IP( 50 p S 100 p = IP( 50 50 5 IP(Z 0 = 1 2 ; üðïõ Z N(0; 1 (ÔõðïðïéçìÝíç ÊáíïíéêÞ êáôáíïìþ 50 p IP(50 < S 100 < 75 = IP( < S 100 p < 75 p = 50 50 5 S < 100 p IP( < 75 50 5 = IP(5 < Z < 0 = Φ(5 Φ(0 1 1 2 = 1 2 ; üðïõ Z N(0; 1 êáé Φ( áèñïéóôéêþ óõíüñôçóç êáôáíïìþò ôçò TõðïðïéçìÝíçò KáíïíéêÞò êáôáíïìþò. ÈÝìá 2. á IP( 1 2 X 3 2 = F (3 2 F (1 2 = 1 2 3 2 1 2 1 2 = 3 4 1 4 = 1 2 : IP(X 1 2 X 3 2 = IP( 1 2 X 3 2 IP(X 3 2 = 1 1 2 F ( 3 = 2 1 3 2 2 2 = 2 3 Ç óõíå Þò ôõ áßá ìåôáâëçôþ X Ý åé óõíüñôçóç ðõêíüôçôáò ðéèáíüôçôáò ôóé f(x = 1 2 ; 0 x 2: Ç ìýóç ôéìþ åßíáé IE(X = f(x = df (x dx : xf(x(dx = 2 0 x 1 2 dx = 1 Ãéá ôç äéáóðïñü éó ýåé Var (X = IE(X 2 IE(X 2 üðïõ 2 IE(X 2 = x 2 f(xdx = x 2 1 2 dx = 4 3 Áñá Var (X = 4 3 12 = 1 3 ( â' ôñüðïò: Ðáñáôçñïýìå üôé ç ô.ì. åßíáé Ïìïéüìïñöç êáôáíïìþ óôï [; ]; üðïõ = 0 êáé = 2: Ç ìýóç ôéìþ äßíåôáé áðü ôïí ôýðï IE(X = + = 0+2 = 1 êáé ç 2 2 äéáóðïñü áðü Var (X = ( 2 = (2 02 = 4 = 1: 12 12 12 3 0 2

â Ç ìåôáâëçôþ Q áêïëïõèåß ôç ÊáíïíéêÞ êáôáíïìþ Í(85; 400: Óõíåðþò ç ðéèáíüôçôá ìéá ìýôñçóç íá åßíáé ìåãáëýôåñç ôïõ 65 åßíáé IP(Q > 65 = IP( Q 85 65 85 > 20 20 = IP(Z > 1 = 1 Φ( 1 = 1 [1 Φ(1] = Φ(1 0; 84 üðïõ Z N(0; 1 êáé Φ( áèñïéóôéêþ óõíüñôçóç êáôáíïìþò ôçò TõðïðïéçìÝíçò KáíïíéêÞò êáôáíïìþò. ïõìå 10 áíåîüñôçôåò ìåôñþóåéò (äïêéìýò Bernoulli üðïõ óå êüèå äïêéìþ åíäéáöåñüìáóôå ãéá ôï ßäéï åíäå üìåíï ôï èåùñåßôáé åðéôõ ßá. Åðéôõ ßá åßíáé ç ìýôñçóç íá åßíáé ìåãáëýôåñç áðü 65. Ç ðéèáíüôçôá åðéôõ ßáò åßíáé ðüíôá ßäéá p = 0; 84 êáé ç ðéèáíüôçôá áðïôõ ßáò åßíáé 1 p = 1 0; 84: Óõíåðþò ç ìåôáâëçôþ Y ç ïðïßá åêöñüæåé ôïí áñéèìü ôùí åðéôõ éþí óôéò 10 ìåôñþóåéò, áêïëïõèåß ÄéùíõìéêÞ êáôáíïìþ ìå ðáñáìýôñïõò = 10 êáé p = 0; 84: ( 10 IP(Y = k = 0:84 k (1 0; 84 10 k ; k = 0; 1; : : : ; 10: k ïõìå IP(Y 2 = 1 IP(Y = 0 IP(Y = 1 = 1 (1 0; 84 10 10 0:84 (1 0; 84 10 3

ΘΕΜΑ 3 α Για την επιλογή της κατάλληλης μεθόδου θα πρέπει αρχικά να ελεγχθεί αν τα δύο δείγματα έχουν ή όχι ίσες διακυμάνσεις. Από τον έλεγχο των διακυμάνσεων προέκυψε ότι F=1.737 για 19β.ε. του αριθμητή και 29β.ε. του παρονομαστή οπότε θέτουμε Η ο : s 2 1 = s 2 2 έναντι Η 1 : s 2 2 1 s 2 Στη σ.σ. α=0.05 από τον Πίνακα βρέθηκε F 0.05(19,29 =2.23. Αφού F=1.737< F 0.05(19,29 =2.23 γίνεται δεκτή η μηδενική υπόθεση άρα τα δύο δείγματα έχουν ίσες διακυμάνσεις. Επιλέγουμε τον t έλεγχο των διαφορών των μέσων τιμών δύο δειγμάτων ανίσου μεγέθους με ίσες διακυμάνσεις, οπότε υπολογίζεται t=1.88. Θέτουμε την θέτουμε Η ο : x 2 > x 1 έναντι Η 1 : x 2 x 1.Έχουμε σ.σ.α=0.10 (μονόπλευρος έλεγχοςβ.ε.=30+20-2=48., οπότε t α(1,010 =1.299< t=1.775, άρα γίνεται δεκτή η Η ο β Το δείγμα είναι ανεξάρτητο, Ν=60>50 και δεν πληρούται το κριτήριο όπως μέχρι 20% των περιπτώσεων να είναι μικρότερο του 5. Αρα μπορεί να εφαρμοσθεί ο χ 2 έλεγχος με προσοχή. Βρίσκουμε αρχικά τις απόλυτες εμπειρικές και θεωρητικές συχνότητες.από την εφαρμογή του ελέγχου χωρίς συνένωση προέκυψε ότι χ 2 =14.192. Θέτουμε Η ο :έχουμε καλή προσαρμογή έναντι της Η 1 : δεν έχουμε καλή προσαρμογή. Στη σ.σ. 0.05 για β.ε. 5 (ταξεις διαστημάτων-1-0 =4 (ρ=0 γιατί δίνονται οι παράμετροι της θεωρητικής κατανομής και δεν υπολογίζονται από το δείγμα από τον Πίνακα βρέθηκε χ 2 0.05=9.488. Αφού χ 2 0.05=9.488< χ 2 =14.192, απορρίπτεται η Η ο. Επειδή είναι λίγες οι τάξεις διαστημάτων δεν θα έπρεπε να γίνει συνένωση. Αν γινόταν συνένωση των δύο τελευταίων τάξεων, προκύπτει χ 2 =13.905 και τώρα για β.ε. =3 έχουμε χ 2 0.05=7.815. Αφού χ 2 0.05=7.815< χ 2 =13.905 και πάλι απορρίπτεται η Η ο. Αυτό ήταν αναμενόμενο γιατί στην επεξεργασία χωρίς συνένωση υπήρχε μεγάλη διαφορά μεταξύ υπολογισμένης (14.192 και κρίσιμης χ 2 τιμής (9.488.